其他
【珍藏版】Nature Review Cancer万字综述|癌症模型的基因组演化
癌症模型的使用会受到其基因组演化的强烈影响,Nature Review Cancer发表长文对癌症模型的基因组演化进行综述,联川生物为您带来全文翻译。
癌症研究非常依赖模型系统的建立,癌症模型可以在一定程度上反映人体内真实肿瘤的情况。对于肿瘤而言,一个非常重要的特征就是它的瘤内基因组异质性和基因组不稳定性。然而,癌症模型中的基因组不稳定性却很少在研究中得到关注。我们对癌症模型中的基因组不稳定性的相关研究进行了回溯和综述,并且讨论了它在生物学上的起源,以及未来在基础研究以及癌症精准治疗上的应用。我们还讨论了应对癌症基因组演化的手段以及其中的危机与潜在机会。
简介
癌症的一个重要特征就是体细胞的基因组不稳定。癌细胞基因组的演化带来了遗传和表观遗传层面的变异,随之引发的细胞层面异质性则为后续更多的变异提供了可能。近年来,由于单细胞组学以及测序技术的进步,肿瘤的克隆异质性和演化过程开始逐渐得到研究,并且其在癌症演进过程中的重要性以及对癌症临床治疗上的影响逐渐凸显出来(之前有过相关综述1,2)。对于癌细胞的功能性研究依赖于病人起源的细胞模型,例如病人来源的细胞系(patient-derived cell lines, PDCLs),病人来源的类器官(patient-derived organoid, PDOs)以及病人来源的移植瘤(patient-derived xenograft, PDXs)。要成功建立这些模型,需要肿瘤细胞能够适应新的环境条件和完全不同的选择压力,并且在传代过程中持续选择能够快速增殖的细胞(3,4,5)。并且,癌细胞在增殖过程中很难正确保持其基因组完整性(之前有过相关综述6),其固有的基因组不稳定性使它们在增殖过程中容易出现基因组损伤的快速累积。非病人起源的癌症模型,例如基因工程小鼠模型(genetically engineered mouse models, GEMMs),同样在宿主水平和肿瘤水平经历基因组的演化(7)。由此,癌症模型的演化渐渐成为了癌症模型研究当中的一块重要部分。近年来,癌症模型构建方面的技术进步极大地拓宽了模型在癌症精准治疗方面的应用面。首先,大队列的癌症模型得以备构建,并且大量的基因型和表观遗传数据被用于在群体水平寻找基因型-表型之间的关联(8-31)。其次,病人来源的模型被当做实体肿瘤的替代品,用来测试病人特异的药物反应(31-35)。对于这两种应用方式,癌症模型都应当准确地反映它来源肿瘤的状况,无论是表型还是基因型层面,尤其需要在传代之后保持基因型和表型的稳定。但是由于这些癌症模型倾向于发生进化,所以正确使用癌症模型进行研究离不开对模型的准确评价。癌症模型的演化很有可能导致模型应用中的另一个问题:复现性。所谓的“复现性危机”,指的是我们很难去复现文献当中曾经提到过的结果,这一现象最近引起了人们的极大关注,而癌症研究则处于这一危机的讨论中心。数据显示,只有11-25%的癌症研究可以被工业实验室复现结果(36-37)。例如,使用癌症细胞系的大规模药物筛选研究之间出现了不同结果,并且在文献中进行了相关讨论(38-40)。尽管对这种差异已经提出了多种可能的解释(39-45),模型演化对这些差异的影响还远没有得到揭示。在这篇文章中,我们总结了已经被发现的癌症模型进化的证据,包括它在生物学上的机制,以及可能呈现出的功能性结果。我们强调了癌症模型进化对基础研究和临床转化包括精准治疗等各方面的影响。最后,我们还针对如何减轻基因组演化对癌症模型研究带来的影响提出了建议,并且对未来的研究如何在此基础上更进一步提出了展望。
模型演化:证据和普遍性
驱动进化的因素(图1)在GEMMs和病人来源的诸多模型之间是不同的(表1)。基因组演化的速度由基因组内部的异质性,以及各个细胞的基因组稳定性决定。对这些指标进行定量可以用于进行后续的基因组演化跟踪和评估(Box1)。
Box1 在癌症基因组中衡量基因组演化水平
跟踪癌症模型基因组演化的能力近年来大有提升。首先,DNA和RNA测序的成本大幅下降,使得常规测序的深度能够大幅提升,从而能够检测到在整个癌症细胞群体中非常稀有的突变,并且能够在病情进展的多个节点进行基因组组成的测定(52,81,83)。其次,单细胞测序技术现在能够在单细胞水平对细胞异质性进行研究(83,108,109),并且分离单个细胞并且分化成克隆的能力提升使得对单克隆进行功能研究成为可能。第三,使用基因组数据进行克隆结构推断的分析工具(107,122,123)和识别基因组不稳定标志物的分析工具(124,125,126)也相继被开发了出来。这些因素使得对模型的一致性和基因组不稳定性进行分析能够在更高的精度得以实现。值得注意的是,基因组异质性和基因组不稳定性这两个术语虽然从概念上很像,在定量上也存在相关性,但是它们描述的是不同的现象。异质性指的是在细胞群体内部发生的基因突变,而不稳定性指的是基因组在长时间内保持稳定性的能力出现缺失。对这癌症模型的两个性状进行检测是了解模型随着时间推移发生变化的必经之路。
肿瘤从头演化GEMMs是研究肿瘤异质性和追溯肿瘤演化的强大工具。随着基因组编辑技术以及肿瘤分子分型技术的进步,它们已经被广泛用于各种应用场景(之前有过相关综述7,46,47)。由于GEMMs最初由人为改变1个或少数几个基因而产生,肿瘤形成之前一定会发生基因组演化。数个研究已经证实,不同的演化路径能够在同一个小鼠模型中产生出分子表型完全不同的肿瘤(48,49)。初次之外,基因组演化并不是随机的。我们和其他科学家都已经发现了特定的转基因能够介导特定的次生遗传事件,从而能够识别出肿瘤发生过程中驱动进化途径(50,51,52)。所以,GEMMs的肿瘤形成天然地和基因组演化联系了起来。尽管在人类和小鼠中,肿瘤的基因组状况和引发肿瘤发生的时间都存在相当的差异,但GEMMs与人类患者的肿瘤演化过程非常相似(49,52,53)。小鼠群体中的遗传不稳定性在研究中使用GEMMs需要对小鼠群体进行持续的喂养和繁殖以保证小鼠群体的稳定传代,但是这也产生了代际之间发生基因变异的风险。同一品系的两个小鼠群体如果分开饲养,可能会走上完全不同的演化道路。根据自发遗传变异的速率来估计,每代小鼠可能会出现0.96个有害胚系突变,而对于那些基因组不稳定的小鼠,这个数字可能会更大(54)。由于品系维持严重依赖于近交,所以这些新发突变有大约25%的可能性会变成纯合并且在群体中固定下来。事实上,文献中报道了不同的小鼠亚品系。例如,常用的C57BL/6品系小鼠进化出了多个亚品系,包括两个主要的亚品系C57BL/6J和C57BL/6N,在编码蛋白的基因上有34个单核苷酸变异,2个插入缺失和15个结构变异(55)。这些遗传变异能够和显著的表型变异联系起来(55-58)并且对实验结果产生了不可忽视的影响(59-61)。所以,美国实验动物研究所(US Institute for Laboratory Animal Research, ILAR)为哪些饲养繁育小鼠的实验室分发了标识,以便后续使用适当的命名来区分小鼠的品系分化。
病人来源的模型
癌症细胞系实验室建立的细胞系(established cell lines, ECLs)在培养条件下会发生分化已经是一个不争的事实,并且一些被广泛使用的癌症ECLs(例如宫颈癌模型海拉细胞、乳腺癌模型MCF7细胞系等)发生的分化事件尤为著名(62-67)。事实上,和小鼠的命名类似,现在一个较好的做法就是在不同的研究中对使用的细胞系进行更详细的命名(例如HeLa-CCl2,HeLa-S3或者HeLa-Kyoto)。但尽管如此,一般认为ECLs是单克隆的并且在绝大多数应用中能够保持稳定,在基因组层面或者细胞层面都是如此(8-14)。但同时,这也可能由于缺少较好的培养历史记录(例如传代数很少被详细地记录和追溯)。最近的分子研究较为细致地鉴定了ECLs之间发生的基因组变异,发现了变异、异质性和演化过程是广泛存在的现象。通过比较广泛应用的癌症和非癌症ECLs,我们发现了很多遗传变异,包括点突变、重排和结构变异影响了很多癌症相关的基因。一个比较了超过100个ECLs的研究发现,在比较2个细胞株的时候,有20%的可能一个突变仅出现在其中一株当中(68)。基因转录层面的差异同样也能反映基因组的变异,并且特殊的基因组变异能够对相关通路产生特定的影响(68)。对14株海拉细胞的观测发现了相似水平的基因组和表达差异,同时这些差异经过翻译也成为了蛋白层面的差异(69)。在这些研究当中,常规的细胞培养使得细胞在短短的传代时间中发生了相当显著的遗传变异。与这些研究类似,最近的一个对8个细胞系进行RNA测序的研究发现了不同实验室之间的细胞系存在的遗传差异,以及相关联的转录层面的差异(70)。所以在培养条件下,癌症ECLs会持续发生基因组、转录、蛋白层面的演化,从而导致同一株细胞在分开培养之后会累积巨大的差异。除了基因组层面的差异之外,细胞系之间的分化还体现在表观遗传层面的差异。由于表观的标记存在时间更为短暂,它们对环境的变化相对于DNA序列而言更加敏感,这也导致了细胞株的表观不稳定性。事实上,在人类多能干细胞的研究当中DNA甲基化不稳定以及X染色体失活功能的退化现象都已经被观察到(71,72)。与之相似,人类乳房上皮细胞持续传代培养过程中也发现了由抑癌因子p16INK4A基因转录起始位点超甲基化导致的基因沉默(73),揭示了表观层面的不稳定可能会控制细胞培养过程中的肿瘤发生过程。但是对于细胞株系之间的表观差异至今尚未有更系统的研究。新的病人来源细胞系由上文我们可以了解,癌症ECLs,尤其是那些多年前构建得到的细胞系,经历了持续的基因组演化。但是对于那些最近才建立起来的病人来源细胞系(PDCLs),这种演化对它们的影响有多大呢?最近,为了给癌症研究提供能多的可能性,系统地构建PDCLs的工作已经启动(74-76)。研究者们希望这些近期建立的细胞系能够更好地反映它们来源肿瘤的情况,而不是像那些经过几十年传代培养的细胞系那么糟糕。尽管PDCLs被认为能够很大程度上地保留其来源肿瘤的基因组特征,但是包括模型之间的以及模型与来源肿瘤间的差异都已经被观察到(77-80)。我们最近分析了来源于5种癌症的38个PDCL模型的拷贝数变异(CNA),并且发现了这些模型在建立和早期传代过程中是如何发生演化的(81)。我们发现了传代过程中基因组持续演化的证据,在早期传代和之后的传代细胞之间有大约20%的基因组收到了CNA的影响(81)。有趣的是,CNA在早期传代(5代以下)中的变化速率高于后期传代(10代以后)。这可能说明了模型建立过程就伴随着基因组演化,并且随着模型适应了培养环境,其基因组也变得更加稳定。病人来源移植瘤病人来源移植瘤(PDXs)被认为在生理上与其来源肿瘤更加接近(相对于细胞系模型来说),毕竟它们的产生和增殖过程并不涉及体外培养环境(之前有过综述4,33)。但是,移植瘤所处的体内环境与其来源肿瘤所在的环境也是存在相当差异的。首先,物种的生理和代谢就存在着很大的差异。其次,移植瘤多位于皮下,肿瘤组织所处的信号传递、细胞互作等环境都与原来的微环境有较大的差异。第三,免疫抑制小鼠的体内缺乏免疫系统作用也会影响肿瘤的状况和发育情况(82)。事实上,PDXs在建立和增殖过程中也经历基因组演化过程。对于乳腺癌PDX模型在移植和早期增殖过程的单细胞测序发现了广泛存在的克隆分化,这种分化极大地改变了突变的聚类情况以及变异的等位基因频率(83)。与之相似,人类急性淋巴细胞性白血病移植到小鼠体内形成的移植瘤也发现了向恶性程度更高的方向演化的趋势(84),并且在急性骨髓性白血病的不同克隆中,移植瘤的特性也出现了明显的差异(85,86)。我们对于24个癌种的543个PDX模型进行的CNA分析发现,大约60%的模型在1次传代中出现了至少1个较大的染色体畸变(chromosomal aberration),90%的模型在4次传代中出现了1个以上这种类型的染色体畸变(81)。与PDCLs的结果类似,PDX构建和早期传代的过程中基因组演化的速率最快(81),与模型建立早期的强烈选择压力相一致。很重要的是,基因组演化的速率(每次传代出现的基因组差异含量)在PDXs和PDCLs之间是相似的(81)。对PDXs分析发现,4次传代之后基因组受到CNA影响的比例中位数约为12.5%。需要注意的是,由于体外传代通常涉及更少的细胞分裂次数,所以我们可以推断每次细胞分裂发生的变异数量,体内培养模型要少于体外培养模型,然而这些发现可能与PDXs能够更好保存来源肿瘤基因组特征的认识相冲突。还有一点值得注意,PDXs在传代过程中表观层面更容易受到影响。一项研究比较了非小细胞肺癌的来源肿瘤细胞和由之建立的PDXs的甲基化模式,并且发现了全基因组水平的甲基化斯皮尔曼关联系数较低(0.37-0.49)(87)。尽管部分可能是肿瘤纯度造成的差异,但是这仍然反映了PDXs可能的表观不稳定性。病人来源的类器官病人来源的类器官(PDOs)被用于体外研究癌症的三维模型(之前有过综述3)。多种上皮瘤能通过将癌细胞包埋入一个包含组织特异性的成长因子的三维基质中建立,这种机制可以模拟肿瘤的生态位。相比于常规的二维培养的细胞系,肿瘤类器官有不少优势,包括更复杂的细胞组成。这种培养条件同样能够让正常的上皮细胞得到增殖,从而为提供配对的正常类器官提供了可能性(3)。部分观点认为肿瘤类器官相比于二维的细胞培养,能够更好地保存原有的基因组特征,经历更少的基因组演化过程。首先,从来源肿瘤中建立类器官模型相比于PDCLs更加高效(3),说明建立过程中经历群体瓶颈事件的可能性更小;其次,类器官的培养环境更能还原原本的正常组织环境(3),可能能够减轻体外培养受到的选择压力;第三,PDO的基因组与原发肿瘤相比具备更高的相似性(23,28,30,31),并且PDO的药物反应可以在临床上作为患者真实药物反应的指导(31,88)。尽管如此,PDOs还是不能免受基因组演化的影响。对结直肠癌PDOs的研究发现了广泛的基因组变异(89)。这种长期培养的模型中的一致性很可能与癌症的克隆动力学相关,后者能够改变模型的克隆结构,这一点与细胞系模型和PDXs中的情况非常类似(68,81,83,84)。事实上,PDOs并不能完美地代表它们来源肿瘤的基因组,并且迄今进行的PDO队列研究都报道了在PDO和配对的原发肿瘤之间出现了体细胞点突变和拷贝数变异(23,28,30,31,90)。重要的是,强烈的克隆动力学会导致之前存在的稀有亚克隆发生迅速的扩增(90)。如同其他模型一样,癌细胞固有的基因组不稳定性也会导致类器官模型传代过程中大量原发的基因突变(28)。随着对PDO传代过程中的多个时间点进行基因测序成为可能,我们在未来需要更多地对PDOs受到的基因组演化的影响进行测定。
癌症模型基因组演化的机制
癌症模型当中观察到的基因组演化现象可能是之前就已经存在的异质性所导致的,因为之前克隆动力学的作用可能会导致不同亚克隆出现丰度的变化。一个稀有的亚克隆可以随着模型建立的过程发展成为占主导地位的亚克隆,从而对整个模型的特性产生影响。另一方面,基因组演化也可能是持续的基因组不稳定的结果,基因组不稳定可能会导致传代过程中产生的变异在群体中的积累和固定(图1a)。但无论是稀有亚克隆的扩张还是新克隆的产生,基因组演化都可能是一个随机或者确定的过程,取决于起作用的是遗传漂变还是遗传选择(图1b)。在这两种情况下,模型建立和传代过程中的群体瓶颈效应都可能对模型的演化产生影响和促进的效果(图1c)。然而,如果涉及选择的作用,癌症模型的演化轨迹是否能够代表来源肿瘤的演化轨迹就成为了一个重要的问题(图1b)。
克隆动力学对于大多数肿瘤类型来说,分子异质性都是一个基本特征(2)。病人来源的模型可能一开始就是一个异质性的细胞群体。模型保持原有异质性的程度以及克隆动力学变化的程度都会影响模型的稳定性以及它们正确反映其来源肿瘤状况的程度。克隆动力学在细胞系,PDXs和PDOs模型的进化当中都扮演重要角色。随机的细胞类型转变显示了细胞系群体表型水平的克隆动力学变化(91)。癌症ECLs的研究中近期也发现了克隆动力学变化,同一个细胞系的不同株之间发现了亚克隆的相对丰度差异(68)。单细胞基因组测序发现了乳腺癌PDXs中出现了稀有亚克隆扩张并且显著改变克隆组成的情况(83)。这种克隆动力学的变化也在多种其他癌症类型的PDXs中被观察到(81),食管癌PDOs中也有同样发现(90),并且不仅是模型建立过程,在早期传代和后期传代的PDXs中都有观察到明显的变异(81,83)。遗传漂变很有可能与模型当中的克隆动力学变化相关,尤其是模型建立过程,考虑到模型通常是由一个很小的,随机选择的肿瘤切片当中衍生而来。然而,无论是在细胞系还是PDXs当中,选择都被认为是克隆动力学变化的主要驱动力。在PDXs中稀有克隆的扩增被发现是重复出现的,当同样的肿瘤细胞群体被移植到不同的小鼠身上的时候,观察到了同一个稀有亚克隆的扩张事件,显示这是一个非随机的演化途径(81,83)。类似的,对ECLs进行的DNA条码实验证实了细微的培养环境变化(例如将培养基从RPMI换成DMEM)会引起同样的条码丰度差异(68)。此外,强烈的选择压力例如药物暴露可以导致更强烈的克隆动力学变化。所以,选择驱动的克隆动力学在癌症模型基因组演化过程中扮演非常重要的角色。持续的基因组不稳定基因组不稳定是肿瘤的另一个基本特征,从来源肿瘤延续到肿瘤模型当中。癌症模型当中的基因突变及其速率取决于来源肿瘤当中的基因组稳定机制被破坏。此外,部分类型的基因组不稳定在肿瘤模型当中会得到加剧。例如,染色体分离的精度依赖于整联蛋白的功能,并且在二维培养的过程中这种精度会降低(92)。癌症模型当中持续的基因组不稳定的证据广泛存在。例如通过干扰基因组完整性维持机制相关基因(例如Trp53)得到的GEMMs相比那些通过干扰其他癌症基因和抑癌因子得到的GEMMs基因组稳定性更差(52,93,94)。与之类似,从p53失活的肿瘤中得到的PDXs相比于p53野生型肿瘤中得到的PDXs经历了更多的拷贝数变异(81)。除此之外,具备更高微卫星不稳定性(MSI)的ECLs之间的出现的差异要比那些低MSI的ECLs之间差异更大(68)。我们最近还证实了单细胞来源的ECLs会快速地在遗传、转录、表型等各层面出现异质性(68)。这说明持续的基因组不稳定可能会导致新亚克隆的不断发生,最终导致整个癌症模型基因组组成的改变。肿瘤模型增殖过程中的瓶颈效应基因组演化的程度取决于细胞群体的异质性,也取决于瓶颈效应的严重程度。部分瓶颈效应是癌症模型所固有的,而另一些可能通过实验手段优化能够避免。因此,了解模型建立和增殖过程中可能的瓶颈效应就显得非常重要。每个模型建立会遇到的第一个强烈的瓶颈效应,就是建立过程中的奠基者效应(founder effect)。模型建立来源的肿瘤活检标本仅仅能够代表部分肿瘤区域和部分克隆结构(2)。同时,适应新环境和完全不同的培养条件让模型建立的过程受到了强大的选择压力(5)。对于细胞群体来说,癌症模型的常规增殖过程也会持续地产生瓶颈效应。细胞系、PDOs和PDXs的传代过程会持续地选择那些适应性更高、增殖更迅速的细胞。增殖的环境存在一定的差异,并且这些差异(例如培养介质、试剂批次、细胞密度等)会对模型的演化产生影响。冻融过程同样会产生瓶颈效应,但冻融是体外培养细胞过程中需要用到的常规操作。最后,遗传编辑(包括那些被认为是中性的编辑,比如引入一个报告基因)也会以病毒转染或者抗生素选择等形式引入瓶颈效应。我们最近发现,在ECLs中,大部分变异在持续传代或者基因编辑的过程中被引入,而冻融过程似乎不会造成持续的基因组演化(68)。然而,这个发现是否具有普适性还需要进一步证实。区分明显的肿瘤进化轨迹由于选择效应在癌症模型的基因组演化过程中扮演重要角色,评估肿瘤模型的进化轨迹是否能反映来源肿瘤的进化轨迹就显得非常重要了。细胞系和PDXs的数据都显示了模型和来源肿瘤的进化轨迹之间存在差异。对急性髓细胞性白血病的研究发现,小鼠模型中的奠基克隆并不一定是最开始的来源克隆(85)。在实体肿瘤中,复发特异的CNA在原发肿瘤复发的过程中可以被观察到,然是同样的事件在PDXs和细胞模型当中却很少见(68,81)。由此可见,肿瘤的基因组构成在人体内部和体外培养的条件下会在选择作用下渐渐出现变化,从而导致了癌症模型和来源肿瘤之间的遗传差异。研究和临床方面的影响
癌症模型的基因组演化对于科研和临床转化方面的影响取决于它是否能够改变肿瘤模型在功能鉴定方面的结果,不同的模型受到此现象的影响也是不同的。一旦发现潜在的风险,就应当设计合理的方案来评估、鉴别和控制基因组演化的影响。对表型的影响我们也许认为,尽管癌症模型会持续发生遗传和表观遗传层面的演化,这些演化不一定会转变成为生物学上有意义的细胞特性,这些分子水平的改变可能不会导致明显的实际影响。但不幸的是,这并不是真实情况。模型增殖过程中持续发生的基因组改变被证实与显著的表型变化相关,并且在各个类型的模型当中都有发现(图2a)。
在小鼠当中,一个表型比较分析发现C57BL/6品系小鼠的两个亚系在生理、生化、行为学诸方面都出现了明显的表型分化,包括血压、眼睛形态、骨骼结构、空间记忆等(55)。形态学和行为学方面的差异在多个不同的C57BL/6品系中被鉴定出来,并且和特定的DNA层面的差异相关联起来(56,57)。这些基因组差异引起的表型差异可以被转移到GEMMs上,例如一个C57BL/6小鼠的Dock2基因拷贝数变异被无意中引入了多个小鼠品系,从而使这些小鼠展现了不同的免疫表型(60)。在人类细胞系中,同一个细胞系不同株之间的表型差异及其与基因组变异的联系都有过报道。在我们的研究中,来自不同实验室的MCF7细胞系的27个株细胞倍增时间存在高达3.5倍的差异(培养条件相同的条件下)。形态特征,例如细胞大小和形状也存在相当大的差异,并且这些差异和基因组变异存在很强的关联性(68)。倍增时间和形态学的类似差异在14株海拉细胞中也有发现(69)。这些海拉细胞株对沙门氏菌感染的敏感程度同样存在很大差异,这可能与抗菌相关蛋白表达程度不同有关(69)。癌症模型的一个重要且广泛的用途就是测试药物敏感性和耐受性。文献报道了很多相同细胞系存在不同的药物敏感性的案例:例如泰莫西芬的半抑制浓度IC50在野生型MCF7细胞中有超过100倍的差异(10,95)。为了评估这些差异是否来源于基因组变异,我们分析了27个MCF7细胞系中321个癌症相关的复合物,并且比较了敏感和抗性细胞株之间的基因表达差异。结果令人震惊:对于87%的药物,有至少一个细胞株是高敏感的,并且同时存在一个高抗性的细胞株。其中82%的案例中观察到了药物相关通路的基因表达差异(68),显示基因组差异是药物反应差异的基础。类似的,PDX对靶向治疗的反应也取决于是否存在特定的CNA,并且同样的关系在ECLs中也有发现(81)。所以,基因组演化对药物反应的影响可能在PDXs中和细胞系中是类似的机制。肿瘤替身模型应用肿瘤替身模型实验(avatar experiment)会比较患者的肿瘤药物反应和对应癌症模型的药物反应。对一个病人来源的癌症模型进行多种药物试验的思路可以帮助指导病人的临床用药。一些这样的共临床试验报道了病人和对应PDXs和PDOs的药物反应高度一致(24,31,88,96,97)。尽管这个策略很吸引人并且也很有用,但是也存在一些案例,病人的药物反应和癌症模型并不一致(24,31,88)。这种差异可能是由癌症模型的基因组演化对克隆结构的影响导致的(图2b)。如果基因组演化影响了驱动事件,例如ER+乳腺癌的ESR1基因(如MCF7细胞系进化中观察到的,68)或者恶性胶质瘤的7号染色体三体和10号染色体单体(如在恶性胶质瘤PDXs中观察到的,81)。此外,肿瘤微环境的差异可以极大地影响细胞增殖和药物反应(之前有过相关综述98,99)。我们仍需要更多的研究来弄清楚癌症模型的演化和微环境的差异在多大程度上限制了它们的使用,并且我们能否克服这些困难。对肿瘤模型生物样本库的影响为了能够体现不同病人群体肿瘤的分子多样性,并且能够方便研究表型与特殊的分子特征之间(例如药物反应和某个基因突变之间)的关系,人们在努力构建癌症模型的大队列。对于这方面的用途,特定的癌症模型和来源肿瘤之间的相似性就不那么重要了。但是,仍然有两个很重要的问题:模型队列能够多大程度反映病人群体?在这些队列中鉴定出的分子特征是否稳定?总体来说,大队列的细胞系,PDXs和PDOs能够反映对应癌症种类的基因组状况(23-27,30,100)。但是,仍然有两个很重要的关注点。首先,持续的传代会使模型和来源肿瘤群体之间出现分化和偏移。事实上,一些标志性的基因突变在高代PDXs中较少发现,而在低代PDXs中更为普遍(81)。第二,癌症模型的生物样本库通常只在构建时被鉴定了一次,随后这些数据就被广泛用于查询用途。但是模型是会进化的,这些被用于查询的数据很可能误导研究者。一个被鉴定出的基因突变很可能在研究者拿到的这个模型当中是缺失的,反之也有可能(68,图2c)。上面我们讨论过,在模型建立和早期传代阶段,基因组演化的速度是最快的。基因组演化随后持续对模型产生影响,尽管速率会稍有下降。所以在模型逐渐达到一个足够稳定但仍能反映来源肿瘤的状况的状态的时候对它们进行基因组鉴定可能是一个最优方法。对于PDCLs和PDXs,最优的时间点可能是5-10次传代之间(81),但是这个参数可能随着环境和模型的变化而存在差异。最近,一项研究先构建了PDXs之后从中得到了PDOs。这个操作希望能够两全其美,既利用了移植瘤的高成功率,也利用了类器官易于控制和研究的特点(23,101)。然而,这个策略也同时加入了非常强烈的瓶颈效应,因为肿瘤细胞先从病人转移到小鼠,又从小鼠转移到细胞培养。这种模型建立策略很可能与基因组演化相关,尤其是相反的过程(从细胞系移植到小鼠)已经被证实了会引入演化过程(81)。对筛选工作的影响癌症模型的基因组演化会强烈地影响化合物和遗传筛选的过程。在一个通常的筛选过程中,高剂量的化合物被作用于细胞系的一个随机选择的株。但不同细胞株之间令人震惊的药物反应差异可能说明了化合物是否能经过筛选可能与筛选使用的细胞株相关。这个问题在遗传功能筛选上更为明显,因为后者会加入基因操作和抗生素筛选的过程,这种强烈的瓶颈效应会加剧模型的分化。CRISPR筛选可能受到这个问题影响最大。首先,在细胞内引入Case9和向导RNA的过程通常会涉及两步筛选;第二,与忍受DNA切割有关的突变可能在编辑过程中受到选择(例如两个最近的研究发现CRISPR-Cas9会倾向于去除那些p53通路功能正常的细胞(102,103));第三,CRISPR筛选的结果需要根据CNA的结果进行校正,但是使用的通常是来源细胞株的CNA(13,104,105),如果在实际筛选之前发生了更多的CNA演化,那么校正结果就更不准确(图2d)。事实上, 对于两个MCF7细胞系进行的基因组范围CRISPR筛选显示了截然不同的结果,并且部分差异可能是由于相关基因发生的快速突变导致的(68)。对于复现性的影响当一个实验室得到的结果不能够被另外一个实验室复现的时候,应该考虑一下基因组演化对实验结果的影响。例如,错误配对的C57BL/6亚系GEMMs和野生型的对照能够导致完全不同的结果(59)。显然,很多实用C57BL/6小鼠的研究并没有报告他们使用了哪种亚系。最近对于MCF7和海拉细胞系的基因组与表型比较研究也发现了基因组演化影响癌症研究复现的证据。例如,使用MCF7细胞系研究细胞对蛋白酶复合体抑制的敏感性结果很大程度上依赖于所使用的的细胞株(68)。然而,尽管存在大量的化学和遗传数据之间的差异(38-40),但是我们仍不清楚这多大程度反映了细胞株之间的遗传差异。
应对措施
上述和癌症模型演化相关的很多风险可以通过调整模型构建方法和后续实验步骤来缓解。应对措施主要分为3种:追溯和报告模型增殖过程;对模型的遗传分化进行例行评估;减轻增殖过程中的瓶颈效应。除此之外,研究结果还应该使用不同的模型系统来验证,以确定结果是否足够有代表性。追溯和报告模型增殖过程对模型进行更精确的,考虑模型历史和株系的命名可以让研究者更好地理解观察到的现象,并且避免错误配对的情况。对传代过程保持跟踪并且在文献当中持续报道是一个可取的方式;绝对的传代数量可能并不含有多么重要的信息,但是配对样本的传代数量可以保证研究中样本的正确使用。评估遗传分化对基因组演化进行常规监测可以减轻其害处。对模型进行了长期培养或者模型经历了强烈的瓶颈效应(例如基因编辑或者单细胞克隆)的时候对癌症模型进行分化程度评估是很有必要的。由于细胞株系之间的遗传差异和基因表达差异以及药物反应差异存在较强的相关性(68),可以使用一些价格低廉的手段(例如低通量全基因组测序)来准确评估细胞系的分化。在对细胞进行功能实验的同时对它进行基因组测定不仅是可行的,也是必要的。我们开发了Cell STRAINER来帮助评估细胞系之间的差异。使用者可以上传他们的细胞系的基因组数据,然后这些数据会被用于比较同一株细胞的参考基因组。两个细胞株系之间如果出现较大的遗传改变可以说明两个细胞株系之间出现了较大的分化。当细胞系的错误鉴定和支原体污染成为细胞系研究的主要问题的时候,杂志会要求作者使用DNA指纹图谱对细胞系进行鉴定,以及确认没有支原体污染。类似的,我们也可以想象,未来对于细胞系的遗传鉴定也会成为研究结果发表之前的要求。当然了,同样的分析也可以用于对细胞株进行鉴定,从而取代DNA指纹图谱。鉴于PDXs和PDOs的生物样本库的应用日渐广泛,类似Cell STRAINER的工具也应该开发出来适配这些模型。最小化基因组演化的影响调整实验方法可以用于减少基因组演化及其对表型的影响。首先,尽量避免任何不必要的传代,使用技术来尽量减少最初的实验之后的细胞培养工作(106)。其次,尽可能减少引入瓶颈效应。在实际操作中,这意味着尽可能将培养环境保持稳定,极小的变化都可能导致克隆选择的发生(68)。这同样意味着单细胞克隆应当尽量避免,可用基于细胞群体的方法代替。最好能够模拟人体内的肿瘤生长环境,这样可以尽可能减少选择压力,并且最小化基因组演化的影响。由于长期的传代培养会导致持续的模型演化,在大型研究当中我们应该准备多个冷冻仓来让我们可以保证模型在使用时处于一个合适的传代数。这对于大规模的研究尤为重要,因为下游实验通常在数个月之后才会开展。最后,部分模型具有固有的不稳定性,并且倾向于更快的基因组演化(81)。有时候我们不得不使用,甚至倾向于这样的模型(例如研究基因不稳定时);然而对于大部分应用来说,我们可以把它们替换成更稳定的模型。
新兴的机会
尽管癌症模型的基因组演化带来的风险需要我们注意,并且我们也提出了应对建议,但是这个现象我们可以有创造性地使用它。我们可以从这一肿瘤模型的特征中寻找新的科学问题,发掘新的研究思路。近等基因癌症模型队列在小鼠模型中,不同亚系之间遗传和表型的差异已经成功地被用于解释表型和基因型之间的联系。例如,一个对C57BL/6两个亚系的比较研究发现了解释酒精代谢差异的基因(56)。类似的策略还被用于识别与免疫表型相关的基因突变(60)。同样的方法可以被用于病人来源的模型(图3a)。基因组演化可以构成遗传配对的近等基因模型。这些模型基因型并不是完全一致的,通常多于1个的遗传改变就可以让两个株系产生分化。这些近等基因模型可以被用于研究株系之间的特征差异。比较细胞系之间的基因表达和药物反应差异可以准确地识别与基因变异相关的通路及其影响的功能(68)。这种反向遗传学的手段尤其适用于研究哪些很难被实验引入的遗传事件,例如大型的染色体结构变异。
理解选择压力
由于正选择和负选择都可以对病人来源的肿瘤模型基因组产生影响,癌症模型本身就可以用于研究进化和选择。例如,免疫缺陷的小鼠皮下环境就显著不同于免疫系统正常工作的病人体内环境。这些因素会显著改变肿瘤的进化途径吗?按照这个思路,比较皮下移植瘤模型和来源肿瘤或者比较免疫缺陷小鼠和人源化小鼠模型之间的遗传变异,可以帮助弄清楚这些因素在肿瘤演化过程中起到的作用(图3b)。相似地,追溯PDOs或者细胞系在不同培养条件下的克隆动力学变化可以帮助了解特定培养条件对肿瘤基因组的影响。研究异质性肿瘤异质性是肿瘤生物学的一个基础领域,在药物反应和临床预后上都有重要应用(2,107)。单细胞技术让肿瘤异质性的研究方法发生了重要革命,而高深度测序则让细胞克隆结构重建更加精确(108,109)。癌症模型的异质性特征使研究出现了更多令人感兴趣的方向(图3c)。合作和竞争性互作肿瘤亚克隆之间合作或竞争性的互作可以影响疾病发生以及临床预后的证据已经有相关报道(110)。使用经过基因工程的人乳腺来ECL亚克隆,研究者发现了瘤内异质性导致了肿瘤扩增和扩散(111)。类似的,亚克隆之间的协同作用在斑马鱼黑色素瘤模型中别发现能够增强肿瘤的侵入性(112)。并且,分化的细胞群体可以增强侵入能力和增殖能力(113,114)。并且最近,小儿脑瘤的两个遗传差异很大的亚克隆被发现具有协同作用的能力(115)。肿瘤模型天然的异质性让它们可以被用于研究克隆互作的机制。对细胞系进行单细胞鉴定可能能够帮助确认亚克隆的丰度,以及在不同因素作用下亚克隆的动力学变化。上述实验可以在不使用基因编辑的情况下进行,利用细胞群体中自然发生的突变来研究细胞之间的互作。药物敏感性的决定因素在肿瘤细胞系群体当中存在的抗药克隆最近被认为是细胞系出现抗药性的主要机制(116,117)。对经过barcode处理的细胞群体进行药物处理会导致部分barcode出现富集,说明药物处理会选择预先存在的抗药亚克隆(68,119)。对异质性细胞群体中的抗药亚克隆进行分子、生化和功能研究可以用于研究肿瘤模型中的抗药机制。研究基因组不稳定性由于持续的基因组不稳定性会对癌症模型的基因组产生影响,这些模型可以被用于研究基因组不稳定的细胞机制。事实上癌症模型已经被用于研究基因组不稳定很久了(118,119,120)。然而,最近的技术进步让我们有了更多新的利用癌症模型研究基因组不稳定的方法(图3d)。基因组不稳定的细胞系的单细胞克隆可以在遗传和表达层面出现不稳定性。研究单细胞克隆和来源细胞系之间的遗传分化可以作为研究不稳定性如何出现的方法。另一个思路是在缺乏维持基因组稳定性的细胞系中进行DNA barcoding实验来确认基因组不稳定和抗药性之间的联系。
结束语
基因组进化是在模型系统中不可避免的现象。如同其他导致研究结果不可复现的因素,模型的遗传分化应该得到例行测定,汇报并且在实验中加以控制。这并不应当被视作灾难,也不应该被忽视。癌症模型在过去数年中经历的发展使得人类疾病模型发展得更加完善。而且,我们对此的认识由静态转向动态也是在此方向迈出的重要一步。它可以帮助我们减轻基因组演化带来的不利因素,而且同时我们可以利用这种动态变化开展新的研究方向。癌症模型的进化可以为癌症研究的进化做出贡献。
原文链接:https://doi.org/10.1038/s41568-018-0095-3
*参考文献列表请参见原文
多组学分析为癌症治疗助力
澳洲野兔繁殖和癌细胞进化是什么关系?韩博士有话说
癌症中免疫激动剂抗体发展的前景和挑战(上篇)
癌症中免疫激动剂抗体发展的前景和挑战(中篇)
癌症中免疫激动剂抗体发展的前景和挑战(下篇)